Aller au contenu principal
Fermer

IA : les petits modèles -plus rapides et moins gourmands- ont le vent en poupe
information fournie par Boursorama avec Media Services 03/12/2024 à 14:39

Les experts notent l'émergence de petits modèles d'IA très spécialisés qui permettent d'avoir "de meilleures performances" pour un coût moindre.

Une salle de serveurs à Saint-Ouen-l'Aumône, le 9 juillet 2021. (illustration) ( AFP / ALAIN JOCARD )

Une salle de serveurs à Saint-Ouen-l'Aumône, le 9 juillet 2021. (illustration) ( AFP / ALAIN JOCARD )

En plein essor de l'intelligence artificielle dans tous les secteurs de la société, la tendance aux petits modèles d'IA générative, -souvent suffisants pour la plupart des entreprises- plus rapides et moins gourmands gagne du terrain.

Le laboratoire américain Merck élabore, par exemple, avec le cabinet BCG un modèle pour comprendre l'impact de certaines maladies sur les gènes. "Ce sera un modèle très petit, entre quelques centaines de millions et quelques milliards de paramètres" , détaille à l'AFP Nicolas de Bellefonds, responsable intelligence artificielle chez BCG. Pour comparaison, un modèle comme GPT-3, qui a sous-tendu à son lancement le robot conversationnel d'OpenAI ChatGPT, comptait 175 milliards de paramètres et son successeur, GPT-4, près de 2 trilliards.

Comme d'autres experts, Nicolas de Bellefonds remarque l'émergence de petits modèles très spécialisés qui permettent d'avoir "de meilleures performances ou, en tout cas, équivalentes" à de grands modèles généralistes pour "un coût bien plus faible".

Loin d'une vague européenne, les géants américains de la tech ne s'y sont pas trompés et ont tous sorti des petits modèles cette année. Google propose Gemma, Microsoft a Phi-3 et Meta a présenté ses premiers mini-modèles en septembre, quand OpenAI a livré une version miniature de GPT-4 cet été. "La tendance à la sobriété et frugalité dans la tech est un mouvement important que nous soutenons", a déclaré lors d'un passage à Paris en octobre Kara Hurst, responsable du développement durable chez Amazon, qui propose sur sa plateforme cloud des modèles de toutes tailles.

Plus rapides, moins gourmandes

Résumé et indexation de documents, recherche dans une base de données interne, ces petits modèles peuvent effectuer des tâches simples, souvent suffisantes pour les besoins d'une entreprise ou d'une administration . "Pas besoin de savoir les termes du traité de Versailles pour répondre à une question sur tel élément d'ingénierie", résume à l'AFP Laurent Félix, directeur général France du cabinet Ekimetrics.

Ils sont même souvent plus rapides que leurs grands frères et peuvent "répondre à plus de requêtes et plus d'utilisateurs en simultané", selon Laurent Daudet, patron de LightOn, une start-up française spécialisée dans les modèles d'IA de petite taille qui vont de 8 à 40 milliards de paramètres.

Autre avantage : ces modèles sont moins gourmands en énergie puisqu'il faut "moins de processeurs (GPU) pour les mettre en oeuvre", ce qui explique aussi leur prix plus attractif, ajoute-t-il. Un argument de poids quand les géants de la tech sont confrontés au coût énergétique exponentiel des modèles de plus en plus grands.

Mieux encore, leur petite taille leur permet de fonctionner directement sur des téléphones ou des ordinateurs. "Ça permet d'éviter de faire des déploiements sur le cloud. C'est une des manières de réduire l'empreinte carbone de nos modèles", avait indiqué Arthur Mensch, patron de la start-up Mistral AI, à Libération en octobre.

Plus de sécurité

La pépite française du secteur a lancé à l'automne son plus petit modèle à date, Ministral. L'utilisation directe sur un appareil promet aussi plus de "sécurité et de confidentialité des données" , rappelle Laurent Félix, puisque celles-ci restent stockées en local ou à l'échelle de l'entreprise.

À terme, tous nos objets du quotidien, même notre frigo, pourraient se retrouver avec un petit modèle embarqué, a expliqué en novembre, sur la scène du Web Summit à Lisbonne, Thomas Wolf, cofondateur de Hugging Face. Cette plateforme franco-américaine d'IA en accès libre a sorti cet été sa série de petits modèles SmolLM.

Pour les experts, les grands modèles de langage, qui restent les plus à même de résoudre des problèmes complexes, ne risquent toutefois pas de disparaître mais de fonctionner de façon complémentaire avec des petits modèles.

Dans le futur, "il y aura potentiellement plusieurs modèles qui se parlent entre eux", avance Nicolas de Bellefonds. "Il y aura un petit modèle qui va comprendre quelle est la nature de la question posée et envoyer cette information à plusieurs modèles de taille différente en fonction de la complexité de la question".

"Sinon, on va avoir à la fin des solutions qui sont soit trop chères, soit trop lentes, soit les deux" , conclut-il.

Valeurs associées

5,280 EUR Euronext Paris 0,00%

0 commentaire

Signaler le commentaire

Fermer

A lire aussi

  • Des ouvriers ramassent des fèves de cacao sur la place d'Aboisso, dans le sud-est ivoirien, le 17 mars 2026 ( AFP / Sia KAMBOU )
    information fournie par AFP 24.03.2026 08:17 

    Sur la place d'Aboisso, dans le sud-est ivoirien, des fèves de cacao sèchent sur des bâches au soleil avant de retourner dans leur hangar, où elles s'abîment depuis plusieurs mois dans l'humidité, symbole d'une crise qui persiste dans le secteur. En Côte d'Ivoire, ... Lire la suite

  • BOLLORE : L'analyse ne suggère pas de baisse à moyen terme
    information fournie par TEC 24.03.2026 08:14 

    SYNTHESE Le MACD est négatif, mais il se situe au-dessus de sa ligne de signal : la tendance est en train de changer. Maintenant, le MACD doit franchir zéro pour que la hausse se poursuive dans les jours à venir. Le RSI est supérieur à 50, cela confirme une bonne ... Lire la suite

  • HERMES INTERNATIONAL : Surveiller le comportement des cours sur les supports
    information fournie par TEC 24.03.2026 08:10 

    SYNTHESE Le MACD est négatif et inférieur à sa ligne de signal. Cette configuration dégrade les perspectives sur le titre. Mais attention le RSI est survendu, ce qui laisse la possibilité d'une consolidation. Inférieurs à 20, les stochastiques sont extrèmement ... Lire la suite

  • Un A400M de la Luftwaffe, produit par Airbus. (crédit photo : Airbus / P.PIGEYRE/MASTERFILMS )
    information fournie par Reuters 24.03.2026 08:03 

    * TP TEPRF.PA - Morgan Stanley abaisse sa recommandation à "pondération en ligne" contre "sur-pondération" et son objectif de cours à 53 euros contre 112 euros. * AIRBUS AIR.PA - Berenberg abaisse son objectif de cours à 190 euros contre 210 euros. * RENAULT RENA.PA ... Lire la suite

Pages les plus populaires